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в компьютерной лингвистике. Порождающие 
паттерны. Часть [. АБзгас( Еасогу и ВиПаег 


Статья посвящена вопросу использования порождающих паттернов в решении задач компьютерной 
лингвистики. В статье дается определение паттернов, история их создания, рассматривается структура, 
особенности использования и возможности применения. Подробно разобраны паттерны АБзгас“ 
Еасогу и ВиИаег. 


Введение 


Цель данной статьи — провести исследование, посвященное вопросу применения 
некоторых приемов построения информационных систем при решении задач ком- 
пьютерной лингвистики. 

С момента своего появления языки программирования постоянно развивались, 
появлялись новые методы и подходы к созданию программных продуктов. В качестве 
основных этапов такого развития можно выделить: машинно-ориентированные языки 
(программирование в машинных кодах, ассемблеры), процедурные языки, объектно- 
ориентированные языки. Таким образом, можно отметить, что эволюция програм- 
мных средств протекает в сторону создания более абстрактных инструментов, призван- 
ных решать не столько задачи реализации определенного функционала, сколько задачи 
проектирования системы. С середины 90-х годов на базе объектно-ориентированных 
языков начинает активно развиваться новый подход к разработке сложных систем — 
использование паттернов (или шаблонов) проектирования. На сегодняшний день исполь- 
зование паттернов является вершиной эволюции методов разработки программного 
обеспечения. 

Использование паттернов базируется на создании иерархий классов специального 
вида. Реализация такого подхода не налагает на язык программирования никаких допол- 
нительных требований, а потому поддерживается всеми объектно-ориентированными 
языками. Широкое распространение подход получил благодаря некоторым своим 
специфичным свойствам: 

1. Позволяет повторно использовать дизайн (а иногда и код) в другом проекте 
без внесения изменений. 

2. Увеличивает гибкость разработанной системы, позволяя вносить или удалять 
из нее элементы за минимальное время, без переработки системы целиком. 

3. Упрощает сопровождение системы, позволяя изменять ее части независимо. 

4. Предоставляет легкий способ единообразно конфигурировать и изменять всю 
систему целиком. 
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Основная идея паттернов заключается в том, что существуют определенные 
классы задач, которые программисту приходится решать вновь и вновь при разра- 
ботке различных приложений. Соответственно, существует некий каталог таких типич- 
ных задач и типичных методов их решения. Наиболее известными на сегодняшний 
день являются несколько таких каталогов или языков (1апечасе), как их иногда назы- 
вают авторы. Это каталог паттернов группы авторов, получившей в интернете название 
«банда четырех» (гапс оЁ ог) [1], и каталог «Фаулеровских» паттернов, изложенных 
в работе [2]. Существуют и другие каталоги паттернов, например, каталог паттернов, 
рекомендованных для использования в языке Лауа, составленный специалистами ком- 
пании Зип [3], и каталог паттернов для .пеЁ разработчика [4]. Составлены также каталоги 
специфичных паттернов и для некоторых других языков программирования. Существуют 
и каталоги паттернов от крупных ИТ-компаний, например, от Мпсгозой. 

Будучи ограниченными рамками статьи, мы не сможем рассмотреть все популяр- 
ные каталоги паттернов, поэтому остановимся на классическом каталоге «банды четы- 
рех» [1]. Далее мы попытаемся проанализировать паттерны данного каталога и оценить 
возможности их применения при решении задач компьютерной лингвистики. 


Паттерны проектирования 


Определение 


В разработке программного обеспечения паттерн проектирования (4е51еп рае 
{егп) — это обобщенное, повторно используемое решение часто встречающейся проб- 
лемы проектирования. Паттерн проектирования не является готовой конструкцией, 
которую можно воплотить прямо в код. Паттерн — это некое описание или шаблон 
решения проблемы, который может быть применен в различных ситуациях. Объект- 
но-ориентированные паттерны проектирования обычно описывают связи и механизмы 
взаимодействия классов или объектов, при этом не задавая окончательных классов и 
объектов приложения, которые будут представлены в коде. 

Не все паттерны, применяемые в разработке программного обеспечения, являются 
паттернами проектирования. Например, алгоритм — это тоже паттерн, но предназна- 
ченный для решения вычислительных задач. 


История возникновения 


Как архитектурный принцип паттерны открыл Кристофер Александер (Си5®- 
рНег А!ехапаег) в 1977 — 1979 годах. Основные идеи подхода он изложил в работе [5]. 
В 1987 году Кент Бек (Кепё ВесКк) и Вард Каннингам (\Мата Сиппшеват) начали 
экспериментировать с идеей применения паттернов в программировании. В том же 
году они презентовали результаты своей работы [6], [7] на конференции ООРЗГА, 
после чего другие исследователи также присоединились к их работе. Результатом 
совместной работы ученых стала разработка паттернов проектирования для создания 
графических оболочек на языке ЗтаШаК. 

В 1988 году Эрих Гамма (Ейсв Сатта) в цюрихском университете начинает 
работу над докторской диссертацией на тему применения паттернов в проектировании 
программного обеспечения. 

В 1989 - 1991 годах Джеймс Коплин (Латез СорЦПеп) работает над сходной идеей — 
разработкой идиом для программирования на С++ и публикует в 1991 году книгу 
«Адуапсеа С++ 141ютп$» [8]. 
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В 1991 году Эрих Гамма заканчивает работу над докторской диссертацией и 
переезжает в США, где в сотрудничестве с Ричардом Хелмом (Васвага Нет), Ральфом 
Джонсоном (КарЬ Лобп$оп) и Джоном Влиссидсом (Тоби УП$5$14е$) начинает работу 
над книгой, посвященной паттернам проектирования. Именно после выхода книги 
«Оез1еп Райегиз: Е!етеп$ оГ Кеизае Оес-Опеще4 ЗойЙ\маге» [1] в 1994 году пат- 
терны проектирования получают широкую популярность в компьютерных науках. 
Также в 1994 году проходит первая конференция «Райеги Гапеиазе$ оЁ Ргоотатилт? 
Соп{егепсе» и создается Портлендовский Репозиторий Паттернов (РогЧапа Райеги 
Верозйогу) для документирования паттернов проектирования. 


Особенности использования 


Использование паттернов проектирования позволяет ускорить процесс разработки 
ПО, благодаря использованию испытанной, доказанной парадигмы разработки. Пос- 
троение правильного дизайна информационной системы требует рассмотрения большого 
количества вопросов, некоторые из которых могут возникнуть только на этапе внед- 
рения. Повторное использование паттернов проектирования при разработке дизайна 
помогает избежать неверных действий, которые ведут к возникновению проблем на 
поздних стадиях реализации, а также повышает прозрачность и читаемость кода для 
других разработчиков и архитекторов, знакомых с паттернами. 

Отрицательные моменты применения подхода следующие: 

1. Для достижения гибкости паттерны проектирования часто вносят в дизайн 
дополнительные косвенные уровни, которые в некоторых случаях могут усложнить 
дизайн и ухудшить производительность приложения. 

2. По определению, паттерн должен программироваться заново для каждого 
приложения. Поэтому некоторые авторы усматривают, что это шаг назад по отношению 
к повторному использованию кода, предоставляемому компонентами. Поэтому иссле- 
дователи работают над преобразованием паттернов в компоненты. Мейер (Меуег) и 
Арноут (Атпоий) заявляют о достижении двух третей успеха в компонентизации наиболее 
известных паттернов [9]. 

Часто люди понимают, как использовать определенную методологию проектиро- 
вания для решения определенного класса проблем. Методологии такого вида очень 
сложно применять для решения более широкого, чем они изначально предназначены, 
класса задач. В отличие от таких методологий, паттерны проектирования сразу предос- 
тавляют общее решение, описанное в формате, не требующем специфических привязок к 
конкретной проблеме. 


Структура 


Паттерны проектирования скомпонованы в несколько секций. Всего рассматриваемая 
нами книга содержит 23 паттерна: Порождающие паттерны (5), Структурные паттер- 
ны (7) и Паттерны поведения (11). Каждая из секций предназначена для решения задач 
определенного вида и содержит прототип микроархитектуры, который разработчик 
может скопировать и адаптировать к своему собственному дизайну для решения пов- 
торяющихся проблем, описанных паттерном проектирования. Микроархитектура — 
это набор программных компонент (классы, методы и т.д.) и их взаимосвязей. Разработ- 
чики используют паттерны проектирования, привнося в свой дизайн эту микроархитектуру, 
в результате их дизайн будет иметь архитектуру, схожую с описанной в выбранном 
паттерне. 
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Дополнительным преимуществом паттернов является упрощение коммуникации 
между разработчиками, т.к. позволяет им использовать одинаковый словарь терминов 
при обсуждении архитектуры приложения. 


Порождающие паттерны 


В связи с ограниченным объемом статьи в первой части мы рассмотрим только 
возможные применения в лингвистике только нескольких порождающих паттернов. 
Остальные паттерны будут рассмотрены в следующих статьях. Далее в тексте главы 
будут использованы некоторые схемы и цитаты из работы [1]. 

Основная задача, решаемая порождающими паттернами — абстрагирование про- 
цесса порождения объектов. Они позволяют сделать систему независимой от способа 
создания, композиции и представления объектов. 

Для порождающих паттернов актуальны две темы. Во-первых, эти паттерны 
инкапсулируют знания о конкретных классах, применяемых в системе. Во-вторых, 
скрывают механизмы порождения и взаимодействия экземпляров этих классов. Все, 
что известно системе об объектах, — это их интерфейсы, объявленные в абстрактных 
классах. Следовательно, порождающие паттерны предоставляют значительную гибкость 
в вопросах, что создавать, как создавать и когда создавать. 

Существует два стандартных способа параметризации системы классами создава- 
емых ею объектов. Первый способ — порождение подклассов от класса, создающего 
объекты; что соответствует паттерну Еасюгу Мефо4. Основной недостаток метода: 
может понадобиться создавать новый подкласс лишь для того, чтобы изменить класс 
продукта. Такие изменения могут быть каскадными. Например, если создатель «продукта» 
сам создается фабричным методом, то придется замещать и его создателя тоже. 

Другой способ параметризации системы больше зависит от композиции объектов: 
определите объект, ответственный за знание классов объектов-продуктов, и сделайте его 
параметром системы. Это ключевой аспект паттернов Аббас! Еасюгу, ВиПаег, Ргоюбуре. 
Все три содержат создание нового «фабричного объекта», ответственного за создание 
объекта-продукта. В АБзнасё Еасюгу фабричный объект производит объекты разных 
классов. Фабричный объект паттерна ВиИ4ег пошагово создает сложный продукт, следуя 
специальному протоколу. Фабричный объект паттерна Ргоюбуре изготавливает продукт 
путем копирования объекта-прототипа. В последнем случае фабричный объект и прото- 
тип — это одно и то же, поскольку именно прототип отвечает за возврат продукта. 

В некоторых случаях сразу несколько порождающих паттернов могут предлагать 
решение задачи проектирования. В каждом конкретном случае решение о выборе 
оптимального паттерна должно приниматься отдельно, в зависимости от задач, сто- 
ящих перед разрабатываемой системой. Также бывают ситуации, в которых оправдано 
использование композиции порождающих паттернов. 


Паттерн АБ5гас{ Еасюгу (Абстрактная фабрика) 


Назначение 

Предоставляет интерфейс для создания семейств взаимосвязанных или взаимозави- 
симых объектов, не специфицируя их конкретных классов. 
Суть 


Все обращения клиента идут к одному абстрактному классу (АБзгасе Еасфогу), 
который на самом деле реализован одним из конкретных классов-фабрик (Сопсгее Еасюгу), 
который умеет производить специфичные для него виды продуктов (т.е. классов). Сам же 
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клиент обращается к продукту, используя интерфейс, заданный в абстрактном классе 
данного вида продукта. Схематически паттерн изображен на рис. 1. 
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Рисунок 1 — Структура паттерна АБз5гас( Еасюгу 


Описание функциональности 


Когда приложению требуется породить экземпляр определенного класса, оно 
не порождает его напрямую, вызывая конструктор нужного класса. Вместо этого 
приложение обращается к специальному объекту-фабрике с просьбой породить объект 
нужного класса. Объект-фабрика имеет интерфейс, описанный в абстрактном классе 
Аб5гас( Еасогу. В его интерфейс включены методы порождения всех необходимых 
нам объектов (СтежеРгодас(А, СтежеРгодисВ...). Таким образом, мы уменьшаем коли- 
чество зависимостей, заменяя зависимость приложения от всех необходимых ему классов 
на зависимость от объекта-фабрики. Вызов метода фабрики возвращает нам объект 
запрошенного класса. 

Сами объекты-продукты содержат интерфейсы, описанные в абстрактных классах 
продукта данного вида и набор подклассов для порождения объектом-фабрикой. Обычно 
каждый конкретный экземпляр абстрактной фабрики порождает экземпляры своего 
подкласса продукта. То есть если у нас в системе содержится две реализации абстрактной 
фабрики (СопсгееЕасюгу1, СопсгееЕасюгу2)) и существует два продукта (АБзасРгодис(А, 
АБзбгасРгодасВ), то для каждого подкласса фабрики у нас должен существовать 
свой подкласс продукта. То есть Ргодис{А1 и РгодисёВ1 для СопстееЕасюгу1 и Ргодис(А2 
и Ргодас{В2 для Сопсг&еЕасогу2. 

В этом заключается неудобство паттерна АБзбасЕ Еасюгу — рост иерархии классов. 
Обычно каждый класс продукта должен иметь столько подклассов, сколько подклассов 
фабрики существует в системе. То есть при добавлении нового подкласса АБзгасй Еасюгу 
нам нужно будет добавить по одному подклассу к каждому классу продукта. 

Класс АБзёгас Еасфогу содержит набор абстрактных методов, которые должны 
быть реализованы в его подклассах (СопсгееЕасогу1, СопстееРасюгу2, ...). В принципе 
в методы класса АбзгасЕ Еасюгу можно поместить поведение по умолчанию. Экземпляр 
одного из подклассов абстрактной фабрики порождается в начале работы прило- 
жения и, соответственно, конфигурирует приложение подклассами продуктов своего 
вида. В то же время существует возможность заменить его в любой момент работы 
приложения на экземпляр другого подкласса фабрики и, таким образом, переконфи- 
гурировать все приложение. 

Именно легкость конфигурирования системы целиком является основным пре- 
имуществом паттерна Афзгас( Еасфоту. 
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Использование в компьютерной лингвистике 


Наибольшую пользу АБзгасЕ Еасюгу может принести в решении вопроса мульти- 
язычности. Самое очевидное его применение в этом контексте — это реализация многоязы- 
ковых пользовательских интерфейсов (СОТ. В этом случае нам понадобится создать 
по подклассу АБзтасЕ Еасюгу для каждого поддерживаемого языка интерфейса. Сам 
АБ5гасё Еасбогу должен содержать операции создания всех графических элементов 
приложения, они и будут выступать продуктами фабрики. Также понадобится создать 
по подклассу каждого продукта для каждого поддерживаемого языка. 

Теперь при выборе пользователем другого языка интерфейса мы будем созда- 
вать соответствующий этому языку подкласс фабрики и вызывать процедуру перери- 
совки окна приложения, все остальное фабрика сделает автоматически. 

Описанное выше применение паттерна, безусловно, полезно, однако нас в первую 
очередь будут интересовать функциональные применения шаблонов проектирования. 
Предположим, что мы разрабатываем приложение для анализа текстов. Приложение 
должно обладать следующей функциональностью: определять тематику текста; выби- 
рать из текста информацию по семантическому шаблону; реферировать текст; осу- 
ществлять перевод текста на другой язык. 

Каждую операцию мы вынесем в отдельный класс. Так, операции по опреде- 
лению тематики будет выполнять класс ТВетайсАпа[утег, выбирать информацию 
будет шЮЕхбасюг, строить рефераты — АБзнасМакКег, а переводить текст — Тгапаюг. 
Если нам понадобится добавить новую функциональность к системе, то мы просто 
добавим еще один класс, например, ЗреШиеСВескКег, для поиска ошибок в тексте. 

Возникает вопрос, какое архитектурное решение нам нужно применить, если 
мы хотим, чтоб программа была способна работать с текстами на нескольких языках, 
например, на русском и английском? При этом подразумевается, что поведение 
описанных выше классов должно отличаться при обработке текстов на разных 
языках. Решение — применить паттерн Аб5гас( Еасбогу. В результате дизайн системы 
примет вид, показанный на рис. 2. 
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Рисунок 2 — Применение паттерна АБзгас{ Еасюгу в приложении 
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Все обращения Клиента (в данном случае клиентом выступает наше лингвисти- 
ческое приложение) идут к фабрике обработчиков (Нап егзЕас®югу). То есть если пользо- 
ватель запросит построение реферата, то система обратится к Нап егзРасюгу и вызовет 
операцию порождения объекта АБзгас{МакКег (Нап егзЕасюгу —СтеаеАБзиасМакег0). 

В начале работы с системой пользователь указывает, тексты на каком языке он 
будет обрабатывать, например, на русском. В результате такого конфигурирования сис- 
темой будет порожден объект Визз1апНапегЕасюгу. И все запросы клиента будут 
поступать к нему, а не к абстрактной Нап егзЕасюгу. А значит, результатом операции 
СтеаеАБ5асМакег(), описанной в предыдущем абзаце, в данном случае будет объект 
Ви5апАБзасМаКег. Если же пользователь сменит язык обрабатываемых текстов 
на английский, то результатом операции будет объект Ей ИВА ас МакКег. 

И последний вопрос, насколько сложно нам будет добавить к уже готовой системе 
новый язык, например, украинский? 

Для добавления нового языка нам не нужно будет переписывать существующий 
код. Мы добавим еще один подкласс Нап егзЕасюгу — ОКгаитапНап егзЕасюгу и доба- 
вим по подклассу для обработки украиноязычных текстов в каждый из обработчиков. 
То есть ОКганиапТВетайсАпатег, ОКгаптатт®Ехеасюг, ОкгаитапАБзасМакКег, ОКгаптап- 
Ттапаюг. После этих действий наша система сможет обрабатывать также и тексты на 
украинском языке. 


Применимость 


Используйте паттерн Абстрактная фабрика, когда: 

— система не должна зависеть от того, как создаются, компонуются и представ- 
ляются входящие в нее объекты; 

— входящие в семейство взаимосвязанные объекты должны использоваться вместе и 
вам необходимо обеспечить выполнение этого ограничения; 

— система должна конфигурироваться одним из семейств составляющих ее объектов; 

— вы хотите предоставить библиотеку объектов, раскрывая только их интерфейсы, 
но не реализацию. 


Паттерн ВиПаег (Строитель) 


Назначение 


Отделяет конструирование составного объекта от его представления, так что в 
результате одного и того же процесса конструирования могут получаться разные 
представления. 


Суть 


Абстрагирует процесс конструирования составного (сложного) объекта. Все методы 
построения частей (ВиЙаРаг1, ВийаРаг2 ...) сложного объекта принадлежат одному 
абстрактному классу (Ви|4ег). Абстрактный строитель имеет некоторое количество кон- 
кретных реализаций (СопсгееВиЙ4ег1, СопсгееВи!аег2 ...). 

Распорядитель (Риесюг) управляет процессом построения сложного объекта, 
вызывая методы ВиЙдег->ВиЙаРаг1 , Ви!дег->ВиаРано... 

Клиент вначале создает объект ВиИ4ег одного из конкретных классов (Сопстее- 
Ви9ег), потом создает объект Опесюг, сконфигурированный этим ВиЙдегом. ВиИаег 
выполняет все действия автоматически и клиент забирает у него результат. 
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Использование паттернов проектирования... АН 


Бийдег 


[ оиоског [© 
Соп${гис() о 
| 


Для всех объектов в структуре { >< 
Бийаег->ВийаРаг() 
} 


Рисунок 3 — Структура паттерна ВиЙдег 


Описание функциональности 


В целом паттерн ВиИадег похож на АБзгас+ Еасогу, только теперь производство 
продукта состоит из частей. Существуют специальные строители (СопсгееВи!дет), каж- 
дый из которых умеет производить продукт своего вида и содержит все операции по 
созданию частей своего продукта. Также существует специальный объект-управитель 
(Опесюг), который руководит производством продукта, задавая последовательность 
его частей. Общий интерфейс строителей, доступный Опесюг’у, задается абстракт- 
ным классом ВиЙаег. 

Когда клиенту требуется продукт, он создает объект Опесюг, конфигурируя его 
нужным СопсгейеВиИаег и передавая данные для построения продукта. Оптесг, в 
соответствии со своим алгоритмом, обрабатывает исходные данные, передавая запросы 
строителю. Такой подход позволяет использовать один и тот же алгоритм постро- 
ения для создания продуктов различного вида. По окончанию работы управителя 
клиент забирает результат у строителя. 

Основные плюсы паттерна: дает более тонкий контроль над процессом создания 
продукта, т.к. продукт создается по частям, а не весь сразу, как это было в АБзгасЕ Еас‘оту. 
Разделяет код, производящий построение продукта, и код, управляющий процессом 
строительства. 


Использование в компьютерной лингвистике 


В компьютерной лингвистике паттерн разумно использовать при решении любой 
задачи, в которой текст рассматривается как составной объект. В качестве примера 
рассмотрим построение автоматического переводчика. 
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Рисунок 4 — Применение паттерна ВиЙ4ег в приложении 
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Поскольку с точки зрения перевода текст является составным объектом (содержит 
слова, числа, разделители), то разумно для его обработки использовать паттерн ВиПаег. 
В данном случае управитель (Тгап$1аеОесюг) будет осуществлять разбор текста по 
лексемам и для каждого типа лексемы вызывать соответствующую ей функцию стро- 
ителя (Тгапз1афог). Подклассы строителя будут отвечать за преобразование лексемы в 
нужный язык. 

Предположим, мы строим систему автоматического перевода с русского на англий- 
ский и немецкий языки. Тогда в качестве одного из подклассов строителя будет исполь- 
зоваться строитель англоязычных текстов (ВязТоЕпеТгапафог), а в качестве другого — 
строитель текстов на немецком языке (КизТоОегТгап$1а‘юог). Продуктом этих стро- 
ителей будет выступать текст на соответствующем языке (ЕпоТех! или СегТех®. 

Такой дизайн позволяет легко добавлять новые подклассы строителя для пере- 
вода текстов на другие языки. При этом алгоритм разбора текста, заданный в Тгапз1ае- 
Питесюг, остается неизменным. Если мы хотим добавить в систему возможность перевода 
текстов с английского на русский, то нам будет достаточно добавить еще один под- 
класс строителя — ЕпТоКизТгапаюг. В качестве продукта этот строитель будет возвращать 
тексты на русском языке. 


Применимость 

Используйте паттерн Строитель, когда: 

— алгоритм создания сложного объекта не должен зависеть от того, из каких частей 
состоит объект и как они стыкуются между собой; 

— процесс конструирования должен обеспечивать различные представления кон- 
струируемого объекта. 
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